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AE: 总 体 差 异 的 比较 是 医学 ， 经 济 和 教育 领域 中 经 常 遇 到 的 课题 ， 本 文 讨论 缺失 数据 情形 下 两 线性 模 
型 中 响应 变量 分 位 数 差 异 的 经 验 似 然 置信 区 间 的 构造 。 我 们 采用 分 数 线性 回归 填补 法 对 响应 变量 
的 缺失 值 进行 补足 ， 得 到 两 线性 回归 模型 的 “完全 ”样本 数据 ， 在 此 基础 上 构造 响应 变量 分 位 数 
差异 的 对 数 经 验 似 然 比 统计 量 ， 在 一 定 条 件 下 证 明了 统计 量 的 极限 分 布 为 加 权 Xt， 并 利用 此 结 
果 构 造 分 位 数 差异 的 经 验 似 然 置 信 区 间 。 模 拟 结果 表明 在 分 数 填补 下 得 到 的 置信 区 间 具 有 较 高 的 


覆盖 精度 。 
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1 引言 


经 验 似 然 是 Owenb] 在 完全 样本 下 提出 的 一 种 重要 的 非 参 数 统计 推断 方法 ， 经 验 似 然 具 有 很 
多 其 他 经 典 方法 不 具备 的 优点 外， 因此 引起 了 众多 统计 学 家 的 高 度 关注 ， 随 之 被 应 用 到 完全 样 
本 下 的 多 种 模型 和 领域 ， 并 取得 了 不 少 研究 成 果 ， 如 文献 [3-5]。 然 而 ， 在 一 些 实际 问题 (如 市 
场 调查 ， 医 学 研究 ， 民 意 调查 等 ) 中 ， 由 于 一 些 主观 或 客观 方面 的 原因 往往 会 造成 样本 数据 缺 
失 的 现象 ， 此 时 通常 的 统计 方法 不 能 直接 应 用 ， 需 要 先 对 缺失 数据 进行 处 理 ， 目 前 处 理 缺 失 数 
据 最 常用 的 方法 是 填补 法 ， 即 对 每 个 样本 缺失 值 进行 补足 ， 构 造 “ 完 全 ”样本 ， 再 利用 通常 的 
统计 方法 进行 统计 推断 。 如 何 将 经 验 似 然 方法 应 用 到 不 完全 样本 是 一 个 重要 的 研究 课题 ， 近 年 
来 不 少 统计 学 者 在 这 方面 做 了 许多 有 益 的 探索 全 10， 其 中 文献 [10] 讨论 了 缺失 数据 下 线性 模型 
中 响应 变量 分 位 数 的 经 验 似 然 置信 区 间 ， 主 要 思想 是 采用 分 数 填补 法 对 缺失 数据 进行 填补 ， 得 
到 总 体 的 “完全 ”数据 ， 再 利用 填补 后 的 “完全 ”数据 构造 出 线性 回归 模型 中 响应 变量 分 位 数 
的 经 验 似 然 置信 区 间 。 响 应 变量 缺失 是 实际 中 比较 常见 的 一 种 情形 ， 如 在 医学 诊断 和 医学 实验 
中 ， 需 要 在 固定 时 间 点 测量 某 个 指标 (如 体温 )， 但 由 于 某 种 人 为 或 客观 原因 ， 可 能 导致 在 某 些 
时 间 点 上 某 些 测量 指标 缺失 。 分 数 填补 法 是 一 种 多 重 填补 法 ， 最 先 由 Kim #il Fuller! 提出 ， 
该 填补 方法 可 以 减少 随机 填补 带 来 的 方差 ， 所 得 区 间 精 度 比 单一 填补 法 更 高 bol， 因 此 该 填补 
方法 是 一 种 较 好 的 缺失 数据 填补 方法 。 本 文采 用 分 数 填补 法 将 文献 10] 中 的 部 分 结果 推广 到 两 
个 样本 数据 不 完全 的 线性 回归 模型 的 情形 ， 针 对 响应 变量 分 位 数 差异 的 经 验 似 然 置信 区 间 展 开 
讨论 ， 该 问题 的 相关 研究 在 目前 的 文献 中 还 未 被 涉及 ， 而 且 本 文中 所 讨论 的 问题 和 模型 具有 广 

收 稿 日 期 : 2007-12-14. 作者 简介 : 王 历 容 (1979 年 2 月 生 )， 女 ,硕士 . 研究 方向 :数理 统计 . 


* 基 金 项 目 : 国家 自然 科学 基金 (10971038); 广西 科学 基金 (0728092); 教育 部 留学 回国 人 员 科 研 启 动 资 
4 ([2004]527); 广西 研究 生 教育 创新 计划 资助 项 目 ( 桂 学 位 [2006]40). 


464 I E 数 学 学 R 第 27 卷 


泛 的 实际 应 用 背景 例如， 医学 领域 中 ， 考 察 两 种 新 药 的 疗效 的 差异 是 否 明显 ， 经 济 研 究 中 ， 
考察 两 个 不 同 地 区 的 居民 生活 水 平 的 差异 是 否 明显 等 ， 这 些 都 是 需要 解决 的 实际 课题 。 

对 任意 的 分 布 函数 瓦 (.)， 定 义 其 g(0 <q < DAMMA (q) = inf{z|H(z) > gq}. 
FA F() 和 G(.) 分 别 表示 总 体 z 和 2 的 分 布 函数 ， 并 用 0 记 z 的 9 分 位 数 ，A 记 z 和 yy 的 g 分 位 数 
差异 ， 即 A = Gq) — F(a) BEG (a) = 40+ 人 A。 设 z 和 yy 的 样本 分 别 满足 以 下 两 个 相互 独 
立 的 线性 模型 

z=uB+A(ule, y=v'pt+ Biv)r, 
其 中 回归 系数 8 e R?, p e R, A(u) MB(v) 为 已 知 非 负 函 数 ， 随 机 误差 变量 = 和 协 变量 尽 相 
互 独立 ，7 和 协 变量 v 相 互 独立 ， 且 Fe = Er =0, 0 < Vare = 0? < co 0 < Varr = a? < œ. 
由 于 数据 的 缺失 ， 我 们 得 到 以 下 不 完全 简单 随机 样本 


Za, = (Li, Ui, 6x;), i= 1,.… ,m; Z vy; = (Yj, Vi» 6y;), j=1, n, 


KP {u i = 1,--- m} M {u j = 1,… ,nn} 可 全 部 观测 到 ，{zi, i = 1,- pens = 
1 …… ,n} 有 缺失 ，z; RAE, = 1 时 才能 观测 到 ， 而 当 ôs L 0 时 观测 不 到 ， yj RAF by, 
1 时 才能 观测 到 ， 而 当 5, = 0 时 观测 不 到 ， 即 
ee 1, 车 zi 不 缺失 ， poo 1, Ëy 不 缺失 ， 
“Lo, Has 缺失. ” Uo # yy 缺失 . 
FA Zes = (a,u, dz) AZ, = (y, v, dy) DIER {Zr i = 1,---,m} M{Z,,,7 =1,--- n} 对 应 的 
总 体 。 本 文 假定 {zi,i = 1,… ,m} A {yj = 1,… ,nn} 均 满足 随机 缺失 机 制 (MAR)， 即 在 给 
定 包 的 条 件 下 bz 与 z 相 互 独立 ， 在 给 定 v 的 条 件 下 by 与 y 相 互 独立 ， 亦 即 
P(ôs =1|2,u)=P(d,=1]u)=Pi(u), P(by =1]y,v) = P(dy =1|v) = Po(v). 
记 


Tr = D6,, Mgr =M— Tg, Ty = 》 bo My =N-Ty, 
i=1 j=l 

Sr, = {i : be, =1,1=1,::- ,m}, Sme = {i : dg, =0,i=1, m}, 

Sry = {j : by, =1,j=1,::- n}, Smy = {j : by, =0,j=1,::: n}. 
类 似 于 文献 [0]， 文 中 取 窗 宽 a = am > 0, b= bn > 0, URKRKK() MK), HH 
当 m 一 00 时 ，a 一 0， 当 n 一 oo 时 ，b 一 0。 定义 

t/a t/b 
=f Kidu, G= f Kate, 
wi(z, 0, A) = G1 (80 — x) — q, w2(y,0, A) = G2(0 + A - y) - 

UE w (x, 0, A) M wo(y, 0, A) 即 为 文献 [12] 在 完全 样本 情形 下 所 定义 的 得 分 函数 。 为 了 采用 分 
数 线性 回归 填补 法 Qi 对 样本 缺失 值 进行 填补 ， 我 们 先 利 用 观测 到 的 样本 分 别 得 到 6 和 p 的 最 
AN = Feta 


、 z uiui \]—~1 Sa (60, UiTi R jUjvj \]7! £ Öy;VjYj 
eEG E Go +L US). 


t=1 i=1 j=1 
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对 于 某 个 缺失 样本 zi (i€ sm) MBER {A u(r; 一 us Br), j E sr, } PA KIEL bh BAL HH 
Wk (k EN, 此 固定) 个 数据 , 并 依次 记 为 (1 = 1,---,k), BA ul 6,4 A(w)et, (1 = 1,… ,k) 作 
Ac; 的 填补 值 。 对 每 一 个 缺失 值 均 重 复 以 上 填补 过 程 ， 从 而 得 到 填补 后 的 z 的 “完全 ” Pee 


Tli = {xi, tE Sr,) U; br + A(wi)ea, l= 1,-- i ,k, iE Sma }- 


对 于 得 分 函数 wi(zi, 9,A)， i E Sm WH 


Ddi 


22 wi (ub, + A(ui)e}, 0, A) 


来 填补 ， 同 理 可 得 y 的 “完全 ”样本 
= {yj j € Sr; Vpr + B(vi)Th, LU= 1,.. ,k, 7 € sm,}, 


且 用 


k 

1 A 

pe fr + B(u;)T}, 0, A) 
121 


来 填补 得 分 函数 wa(yj,b,A), 7 E Sm, HA rA € {B7 Hv) — vifr), i € Sr, fo 

以 上 填补 方法 即 为 分 数 线性 回归 填补 法 ， 特 别 地 ， 当 天 = 工时 ， 即 为 通常 的 随机 填补 法 。 下 
面 将 利用 填补 后 得 到 的 “完全 ”样本 {zx1,i,，y1,;} 构造 人 的 经 验 似 然 置 信 区 间 。 我 们 将 在 第 2 节 
给 出 本 文 主要 结果 ， 第 3 节 给 出 相关 引 理 和 主要 结果 的 证 明 ， 第 4 节 给 出 数值 模拟 结果 。 


2 主要 结果 


由 于 z 和 % 的 样本 数据 不 完全 ， 我 们 需要 利用 到 以 下 新 的 得 分 函数 


wi(Tr i k, 0, A) = by,w1 (24,9, Akl SY anf Â- + A(us)ey,0, A), i=1,-++,m, 


wal yrds br, A) = 6,t0(4j,9,0) + - F Deal + Bley), j=1,.…,n, 


其 中 
Sik (ui 6, + A(u;) Jen, 9, A) 和 Son Uj 4 Pr + B(v;) Tj, 9, A) 


l=1 


即 为 上 节 提 到 的 缺失 数据 下 相应 的 得 分 函数 的 填补 值 。 类 似 于 文献 [12]， 定 义 经 验 似 然 函 数 
[[»: Ila: 
i=1 j=l 

从 而 得 到 对 数 经 验 似 然 比 统计 量 


R(A) = sup { > log(mpi) + 5 log(ng;)} up R(A, 6), 
i=1 j=l 


pi>0,i=1,--- 971,95 >0,j=1,--- ,n,0 
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其 中 


R(A,0) = sup log(mp;) + log(nq;) ?, 
AD sp, ( J loitan) + > oat a)} 
并 且 pi, qj 满足 
m 
Spi=1, piwi(z1i,k,0, A) = 0, pi>0, t=1,---,m, 
i i=l 
Seah >》 gjwzlurj k, 0, A) = 0, qj > 0, 了 三 1 ,nN, 
| 
由 拉 格 朗 日 乘 子 法 得 
R(A, 0) =— X log {1 + A1(O0)wr(214,k, 6, A)} 一 >》 log {1 + M2 (0)w2 (yr, k, 0, A)}, 
i=l j=l 


其 中 入 (0), 7 = 1 2， 分 别 由 以 下 方程 确定 
Wy (£ii; k, 8, A) 


m 2 1+ A1(0)wr (Tri, k, 0, A) = 0) 
1 2 _ “lyk OA) _ 4 (2) 
1+ A2(O)we(yr,j,k,0,A) 
令 9R(9,A)/66 = 0， 得 到 经 验 似 然 方程 
6, A) Z az(yr j, k,0, A) 
aD 1+ Ai(A@)ur (zri, k, 8, a) 2 1 + à2(8)w2(y7,;, k, 0, A) =A (3) 
其 中 
Qa(ZTa 办 0, A) = Celene BA), (4) 
k,0,A 
&2(Yr j, k, 8, A)= Centos EOS). (5) 


FA 00 表示 6 的 真 值 。 为 了 得 到 本 文 结 果 我 们 需要 如 下 正则 条 件 。 

条 件 1 be9， 并 且 O 是 一 个 开 区 间 ， 

条 件 2 id f(t) = ƏF(t)/3t F g(t) = 0G(t)/8t。 对 某 个 to > 2, ASV) FE, 并且 
在 bo 的 某 个 领域 内 连续 ， 同 时 gl- 的 存在 ， 在 9 + 和 A 的 某 个 领域 内 连续 ， 且 F(bo)g(9o + 
A) > 0; 

条 件 3 4Am,n-wolht, HE —h (0< h< %0); 

条 件 4 对 i = 1 2, K; 有 界 并 满足 一 阶 李 普 希 兹 条 件 ，K(2(.) 存在 且 有 界 。 对 常数 c > 0， 
有 


J K;(u)du = O(a"), J K»(u)du = O(b°), J 1u" K;(u)|du < 00, 
{ul >c/ato jul>c/bto 


7 1, j = 0, 
J 了 j Teuz 
0, 1<j<to- l; 
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条 件 5 存在 7 (1/3 <r < 1/2)， 当 m, 一 co 时 ， 有 mra 一 co 及 mrb 一 oo niato 一 0， 
n2b +0. 

条 件 6 {Zz, ae (xi, Ui, Öz: )) i=l, ,m} Fil {Z,, F (Yis Vir Oy)» j=l, nj} 相互 独立 。 

另外 ， 设 数学 变量 YeRz, CER, id 


6zuu’ dyvv' 
P= P=1), S=E( Bey), =P=), S=E( ge): 


H (2 eqs Za Im) = 5 (niðan (2 bo, A) + (1 — e; 5x01 (ui'y + Alu) A7? (uj) (£; — uj"), 00, A) 
+62,5x,01(xj,00, A) + (1 — Sz; )bz,wr (uj y + A(uj)Aq*(ui)(ai — uY), 6o, A) }, 

G(Zy,,Zy;,¢) = 5 {6u6 2 (vi, bo, A) + (1— 6y,)6y;w2(vi'¢ + B(vi)B™*(v;)(y3 — v3'C), 80, A) 
+5y;5y,w2(yj, 00, A) + (1 — by, )by,w2(v,"¢ + B(vy)B™*(vi)(yi — vi'C), 80, A) }, 


Ai (Zz,,7) = E{ H(Ze,,Z2;,7) | Zz: }, ij; hz(T) = EH (Zz, 2255); hzo(y) = gh) 


CC lo la IG ROBO hl = 2: 


定理 1 设 条 件 1 至 条 件 5 满足 , 则 依 概率 趋 于 1, 存在 经 验 似 然 方程 (3) 的 一 个 根 Onn, R(A,9) 
在 Om n 处 达到 局 部 最 大 值 ， 且 当 m, 一 co， 有 


1 
V (Omn — 9) -> N (o, ai Ff? (0o)o202 + hg? (0o + A)o303}), 


2 2 2 2 


其 中 
co = f?(00)02 + jg2(go 十 A)a3， 
of = Pr?B [2H (Za, P) + hao(B)ST 82A? (uul — wb)]? + Za(1 — 0) 
- ZE{ Pi(u) E[w2(x, 60,) | u] } = ¢ E {01 — Pi(u)) E? [w(x 00, A) |u) }, 
of = Py? E [261(Zy, p) + hyolp)Sz Bloot- v'p)]? + Za(t 一 可 
— ZB Pa(v) B[w3(u,00,) |v] } = Z E { (1 Plo) E? [walu 40,4) |v] } 
a= zaa ~q) + a E { P\(u) B[w?(a, 0, A) | u] } 
+ <= BE (~ Pi(u)) E? [ol 60,4) |u] }, 


of = i40 ~ q) + E E { Palo) E (w(u, 00,4) | 0] } 
k 


+ ETT B{ (1 ~ Pa(v)) E? [waly 0o, A) |] }. 
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由 以 上 定理 知 A 经 验 似 然 比 统计 量 的 极限 分 布 为 加 权 X?， 为 了 构造 A 经 验 似 然 置信 区 间 ， 
需要 给 出 权 
hg2(bo + A)o? + f2(00)o3 


ao(A) = 


的 相合 估计 ， 我 们 可 用 常用 的 Plug-in 进 行 估计 ， 得 到 ao(A) 的 一 个 相合 估计 ao(A)， 由 定 
理 1 得 到 A ( 渐 近 置信 水 平 为 1 - a) 的 经 验 似 然 置信 区 间 {A : 一 265 1(A)R(A,0mn) < Za}, H 
H Za WAL P(x? < Za) =1- a. 


3 ”定理 1 的 证 阴 
为 证 明定 理 1， 我 们 先 给 出 如 下 引 理 。 
引 理 1 在 定理 1 的 条 件 下 ， 当 m,n 一 ok, 


1 m 
vm X oltri k, bo, A) 4, N(0, 07 ’ Rd we(yr, jk, 90, A) 4 N(0, 03), (6) 
i=1 j=l 


其 中 o?, of 定义 同 定理 1。 
证 明 W Bm = o((xi, Ui, 5z,); i= Las m)» 给 定 Bm Pa 由 填补 过 程 中 随机 化 所 产生 的 
条 件 概率 ， 条 件 期 望 和 条 件 方差 分 别 记 为 Pt, E*, Var*. iE (6) 的 第 一 式 。 


1 m 
Tin 》 an (£r, k, 40, A) 
i=l 


k 
= J/m-— D wi (zi, 0o, A) + Vm. = > Do (ub. + A(us)et, O, A)} 


M Es iESmy l=1 


= Em +m + Op(1), 


其 中 Em = Pr} V/MVem(Br)s A 


Vom ( (6) = m2 LSS { 52,52, (Ti, bo, A) 


isl j=1 


+(1 — ôr: Jós wi (ui’B, + Alu) AT (wu) (z; — u;"Br), 6o, A) }, 


Nm = wh > 3 { wi ( Ui ‘By + A(ui)et,, Oo, A) 


t€8m, l=1 


as ee 二 Wy (ui 1B. + A(u;:) AT *(u;)(2; a uj’ Br), 00， A) }. 


T jesr, 


我 们 将 利用 文献 [13] 中 的 定理 2 来 证 明 (6) 的 第 一 式 。 为 此 ， 需 要 分 别 求 出 如 和 mm 的 极限 分 
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布 。 首先 考虑 Vem(Br) o 将 Vim(7Y) 对 称 化 得 
1 m m 
Vm) = 5-5 32 2 { 62.62, 1(zi, 60, A) 


+(1 — ôr; )őz w1 (u; y + Alu) AT (uj) (£; — uz’), 90, A) 


+6r;6zr;w1(Tj, 9, A) + (1 a bx, )bz;wl (u;’7 + A(u;)A7!(ui)xi = ui Y, Oo, A)} 


m 


= 1S SH (Zz, ’ Zn y). 


i=1 j=1 


SBIR, Vem) 是 一 个 V 统 计量，Vim( 记 ) EEPE V GEE, Vem (Bp) 相应 的 UU 统计 


BA j 
m(m — 1) 


Usm(B.) = > H(Zz,, Zn Br), 


1<i<j<m 


且 由 文献 [15] 或 文献 [16] 40 V | Vem (Âr) — Usm (Â) ] = op(1)， 故 
VM Vem (Br) = Vm [Usm (Br) — hs(B)] + Vm he(G) + op(1). (7) 
ESCH [10] 知 Vm [ Uren (Br) — he(8)] 5 
= > { 2H (Zei B) + heo(B)S7 ie, A7? (ui )u:(2: — wB) } (8) 
有 相同 的 极限 分 布 ， 其 中 Ay (Zr b) = E(A(Ze,,22;,8)|Ze,),tA jo FAWR Vm h(l) = 
op(1)o HH (Ze; Ze; Y) HIER hs (y) = E [62,5221 (21,40,4)]t+az(y) HF 
az (7) = B[ (1 — õn, )ôzzw1 (u'y + A(us)A*(u2) (a2 — u27), bo, A) ]. 
由 MAR 假定 知 
E {6z,6z2w1(7, 00, A) } = PE { E(x, | ui)E [wi(z, 60, A) | u1] } 
= PE{ P,(u)E[w1(2, 4, A) lu] }, (9) 
az(7) = E{(1 — Py(ur)) Py (u2)E [w (uiy + A(us)A™* (ug)(22 — u2’y), 40, A) | ur, u2]}, 
因此 , 在 Y= 86 时， 有 
az(P) = E{ (1— Pi(u))P,(u2)E [wi (u18 + A(wi)ez, 00, A) | ui, u2]} 
= E{ (1—P,(u1))P,(u2)E [wi(ur'B + A(ur)er, 90, A) | ui, U2] } 
= PiE {(1 - Pi(u))E [w1 (z, 80, A) | w] } 
= P Ewi(z, 6o, A) — PLE { Pi (u)E [wr (x, 60, A) { us] }. (10) 
EH (9) F (10) 知 


hz(B) = PE { P (u)E [wi(x, 80, A) | u] } + az(8) = P1Ew (z, 8o, A). 
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从 文献 [12] 可 知 Bwi(zi, go,A) = O(ato)， 因 此 ， 由 条 件 5 有 Vmhs(6) = O(m#ato) = o(1)。 
另外 MAR 假定 下 知 EH, (Zzx;,8) = hs(8) = o(1), E E{hzo(8)S_ 16, A? (ui Juil: ~ u;'ß)} = 
0， 于 是 由 (7),(8) 和 中 心 极 限定 理 知 


Bites N(0,1), (11) 


RH ofm = E{2Hi (Zz, B) + hzo(B)ST 62, A7? (u)u(z — wb)}?. 
下 面 考虑 wm。 在 MAR 假定 下 有 


a 1 六 - x 
E*w (ui br + A(ui)er, bo, A) = a > Ww (ui br + A(u;)A~*(u;) (2; = u; Br), ĝo, A). 


JEsrr 
人 “a 2 > (uÂ, + Alue 80,4) ~ Ew (ui’B, + A(us)eh, 00, A)} 
IEsmu 
1 ; f 
z km 2 {E*w? (ui Br + A(uien, bo, A) = [E Wy (wi' Pr 十 A(ui)ed, 8o, A)] 
= Irmi _ Zzm2， (12) 
其 中 
1 ~ 
Tomi = D bD w? (ui’B, + A(u;)A71(uj) (2; = uj'br), bo, A), 


kmr : 
s i€smz 了 ESsrz 


bm = D {= (uÂ + Au) Au) — 04"), bo, A) Y. 


iEsmz jEsry 
下 面 分 别 导 出 Tem 和 Teme 依 概率 收敛 意义 下 的 极限 。 
Temi = = > (1 ~ ða: )b2,W% (ui'By + A(us)A~ (us) (3 ~ uj'B,), bo, A) 
= : ` Pr! : -a SS Hol Ze, Zz; Br) t 0p(1), 


i=1 j=1 


其 中 
H2(Zz,, Zæ; Br) = 3{( ~ ôr Or wt (ua 应 村 A(u;)A7 *(uj)(a; i uj’ Êr), 90, A) 


+6z, (1 = 6x; Jw? (u;’Be + A(uj)A7* (us) (a4 == ui’ Br), 9, A) }. 
WW He(Z2., Zn , 房 ) 是 一 个 带 估计 参数 的 六 统计 量 ， 由 文献 [15] 或 文献 [16] 知 


5 YY Ha(Ze,, Ze; Âr) 


i=1 j=1 


EHə(Zz;, Zr; 3 Br) + op(1) 


= E{P,(u2)(1 — P, (u))E [w? (u8 + A(u1) A~ (u2)(z2 — u2'B), bo, A) | uz, u2] } + op(1) 


PLE{(1— Py(u))E [w7 (æ, 4, A) | ul} + op (1). 


il 
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故 
Lem. = FE {(1-Pi(w)) Blu} (z, bo, A) | u] } + op(1) (13) 
类 似 于 (10) 的 推导 得 
pe 7 (PL? +op(l)} 5 DDD 60,)62, See 
i=1 j=1 k=1 


w (u; Â, + Alu) AT! (wj) (z; — us’ Êr), 80, A) 
x wy (ui Êr + Alui) A~ (ux) (ae — ur’ Br), 8o, A) 
= 1- P]? B {E[(1— ôe, )Szaðzsun (u18 + Aln) A (ua) (22 — ua'B), 00, A) 
x wi(ui B+ A(u1) A~  (u3)(z£3 — ug’), Oo, A) | ui, u2,u3] } + op(1) 
ae z B{ (1 ~ Pi(u))E? [wn (2, 8o, A) | u) } + op(1). (14) 
由 文献 [12] 知 Bw? (x, 80, A) = q(1-¢q)+o0(1), Akt, 484 (12), (13), (14) 知 


2 ca * 
O2m = Var nm 


_ ai~q)  Ef{Pi(u)Elwt (21,40, Aul} _ E{(1 — Pi(u)) E?[wr(z, 6o, A)|ul} 
Fo Oe ae 7 + o1). 
故 由 独立 随机 变量 Berry-Esseen’s 中 心 极限 定理 有 
sup Le” (zanm < t) — ®(t)| = op- (1), (15) 


于 是 ， 由 文献 [13] 中 定理 2 和 (11), (15) 知 
万 S wz k, 80, A) > N(0,02), (16) 
i=l 


即 (6) 的 第 一 式 得 证 。 同 理 可 证 (6) 的 第 二 式 成 立 。 
引 理 2 在 定理 1 的 条 件 下 ， 当 m,n 一 co 时 ， 有 


1 m 
= X w(i k, 8o, A) = 03 + op(1), PET j k, 90, A) = 02 + op(1), (17) 
i=l 


HE 02, of 的 定义 同 定理 1。 
证 明 先 证 (17) 的 第 一 式 。 令 


oa 13.3 (zr, is k, 4, A) = = Igm3 + Inma; 
i=1 


其 中 


k 
Trm3 = L 5D w? (zi, bo, A), Irmá = 1E 伍 > wi( Ui ‘Br +A (uiet bo, A) }. 


1€8r, M ea: l=1 
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由 MAR 假定 知 
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Trm3 = +5 i wi (ai, ĉo, A)} 


i=l 


= E{P(uE [w] (z1, 00, A) | u}} + op(1). 


下 面 求 lem 在 依 概率 收敛 意义 下 的 极限 。 由 于 


we (u;' 8, + A(ui eq, bo, A) 


i s 2 wt (us ‘Br + Alu) AT (u;)(z3 — uj 'Br), Bo, A), 


JEsrz 


k 
E* { z 2 (ui’B, + A(ui)eh, Ao, ay} 


= aE { 5i w(u; Ê, + Alui)et, bo, A) — E*wr(ui'B, + A(uieh, 00, A)] 


A 2 
+E” wn (uÊ, + Alui)Ein 00, A) } 


I 


= D eb + AUA ue = 14/880) 


jEsr 


++ { 二 SY w(u’, + Alu) A~ (us) (2 一 uj'6,),00,)}. 


T jesrs 


?2E3mz 
1 
-g 2 wit(ui’B + Alu) Am (uj) (a5 — u'r), 8o, A) 
F 了 Esr 
k-171 > x 2 
alts > Wy (uC + Alu) A~! (uj) (a; 一 u;'Br), 8o, A) } } 


J€Sr, 


by 1 a : 2 
ie a > { [z you (ui’B, + A(ui)ei, 8o, A)| 
a 1=1 


sji Y os (ub + Aluci to, A)|’), 
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(18) 
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在 MAR 假定 下 ， 由 大 数 定律 知 J = {1 — Py + 0p(1)} -op (1) = op(1)， 故 


1 IÂ = IB 
Tema = a o w? (ui By + Alu) A~ (uz) (z; — ws'B), 80, A) 
Se : By + A(us)A7#(auj)(a2j — wÂ), 80,4) ) + opl 
HAF YY LY (wb, + Alia Mu) 05 — uÂ) 60, A)} + op (1) 


2Esmz T jEsrs 


k 


= Ismi + (k = 1)Izma F op(1), 
HP Temi, Teme 的 定义 同 引 理 1。 于 是 由 引 理 1 的 证 明知 
lems = ZE{ (1 — Pi(w))E [w?(z,0, A) | u]} 


+54 B {1 - Pi(W))E? [le o, A) | u] } + op(1). (19) 


故 由 (18) 和 (19) 知 (17) 的 第 一 式 成 立 。 同 理 可 证 得 (17) 的 第 二 式 成 立 ， 引 理 2 得 证 。 
引 理 3 车 1/3 <m <1/2 并 且 定 理 1 的 条 件 满足 ， 则 对 一 切 9 € {0 : |0- bo] < cn-?} 有 


= Dalerak,0,A) = f(00) + op(1), (20) 
i=1 

= $ alur j,k, 0, A) = 9(60 + A) + op(1). (21) 
j=1 


证 明 先 证 (20)。 记 


1 m 
frmi(0) = P 2 čna (28 A), 


m k 
foma(0) = = Pa- iof i De b+ Atu)ei0,A)}, 


则 由 (3) 知 
= Yan (214,48) = fam (0) + fem2(8). 
i=l 


HH MAR 假定 和 条 件 4， 条 件 5 知 
frm1(0) 


i 
| + 
N 
P ia 

D 
im] 
ajil 
8 
Ner 
+ 
Ja 
—_— 
X 
E, 
a 
8 
N 
Dee 
Sd 
D 
© 
ee 


SUP O* SPF OM Oy Zi. HK 


frm1(0) = E{P,(u)E [a1(x, 9, A) | ul]} + op(1). (22) 
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m k 
fema(0) = ~ S0 Ga) {Don (uih. + Alude, Bo, A)} + op(1). 


E t=1 


由 弱 大 数 定律 知 
fa — ôx [EL (u: Êr + A(ui ein, 8o, )| 
= ; 
_ pr [pLa + A(ui)et, bo, A)| } = op: (1) 
因此 


1 S 1 = 12 * = 1 ae a 
A da 一 E Da Br + A(ui)ei, 90, A)} =P. a XO >》 Hs(2s,, Ze; Br) + op(1), 


其 中 
H3(Zz;, Zz; Âr) = sla = 5x,) 4x, 0 (Ui By + A(u;)A TH (uy) (23 — Uj Br) bo, A) 
+6z; (1 = bx; Jou (u;"B, a A(u;)Aq} (us) (ai a ui! Br); bo, A)] . 
由 文献 [15] BK [16] 知 
5 >》 ， DD H3(Zz,; Zz; Êr) = P E{(1 — P, (u))E [ai(z, 6o, A) | u]} + op(1). 


i=1 j=l 


从 而 
fam2(9) = E{(1 — P, (u))E [ai (z, 00, A) | u]} + op(1). (23) 


由 (22), (23) 知 


bo 
Bea L Santer, i, k, 00, A) = Ear (z, bo, A) + op(1) = “EK, (2— =) + op(1). 
miz 


FA SCAR [14] 中 定理 1 和 条 件 4 有 


二 De kb A) = f(00) + op(1). 
即 (20) 式 成 立 。 同 理 可 证 (21) sh. 
结合 上 述 引 理 1-3， 类 似 于 文献 [12]， 我 们 容易 得 到 下 述 引 理 4-6。 
引 理 4 F1/3<n< 1/2 且 定理 1 的 条 件 满足 ， 则 当 m,m 一 co 时 ， 有 


1(9) = Op(n~"), M2(0) = Op(n~”) 
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对 一 切 9 € {0:10 一 00| < cn- 中 成 立 ， 其 中 c 是 正常 数 。 

引 理 5 41/3 <n < 1/2 且 定理 1 的 条 件 满 足 ， 则 依 概率 1 存在 方程 (3) 的 一 个 根 gr 
=m, n= otf, A \Omn 一 90| = Opn”), A RIA, 0) E bmn SEAR E HBA. 

引 理 6 者 定理 1 的 条 件 满足 ，9mn 如 引 理 5 中 所 定义 ， 则 当 m,n 一 co 时 ， 有 


1 
Vin (bmn ~ 90) = N (0, 3 { F2(00)o?03 + hg?(00 + A)o303}), 
0 


hg(8o + A) 


Fp) Orr) + op(1), Vim d2(8m,n) + N(0,0?), 


A1(@m,n) => 
其 中 
2 
o? = FOO {92(0 + Ajo? + ho! f?(69)03}, 
0 
Co, of, 02, 02, of 后 同 定 理 1. 


定理 1 的 证 有 明 记 


Ri(A,0) = — > log {1+ Ar (O)wi (zri, k, 8, A)}, 


i=l 


R2(A, 9) ES k, 6, A)}. 
j=1 


类 似 于 文献 [3] 中 定理 1 的 证 明 ， 由 Taylor 展开 知 


—Rı (A, Omn) = 5 ÀE, Wi (£ii, k, Om,n> A) 


i=l 


-3 5 MS wt (zi k, Omn, A) + 5 Op{ AS wi (21,45 k, Om,ns A)}. 


i=1 i=1 


W Ag, = A (Omn) AB =A2(Omn)> W 


1 1S -1 
Am, = — J w (Eri ky Omn A) ° {= Pollari k Omm A)} + Op(r%,)- 
i=l i=1 


故 
m 
1 Sater, i,k, Om n A) = àm: = Saker k, Omn, A) + O,(n~?"), 
i=1 人 
因此 
1 m 
—2Rı (A, Omn) = mre, . m 2 oiT k, mm A) + op(1), 
同 理 


1 n 
—2R2(A, bmn) = nàh,- = S © 3 (Yrs, k, Omn A) + op(1). 
j=l 
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故 


1 m 
—2R(A, bmn) = MAZ, - mh bmm A) 


i 2 
二 nA, = A Omn, A) + Op(1) = ao(A) (Ar) +op(1). 
故 由 引 理 6 知 定理 1 成立。 


4 ”模拟 结果 
本 节 将 通过 数值 模拟 研究 A = G-1(g) 一 Fa) 的 经 验 似 然 置 信 区 间 的 性 质 ， 为 此 选取 以 
下 两 线性 模型 。 
gz=uBt+e, B=4, u~ N(1,1), e~ N(0,1), 
y=vp+T, p=2, v~ N(1,2), r~ N(0,1). 
考虑 下 述 两 种 响应 概率 (MAR). 
情形 1 
0.8+0.2ju— 1}, ¥ju-1|<4, 
P (u) = 
0.95, He, 


0.8 +0.2v - 1|, # lv—i1}<4, 
Pl(v = 
0.95, 其 它 . 


情形 2 P,(u) = Po(v) = 0.8。 
对 上 述 两 种 情形 随机 产生 1000 次 不 完全 样本 { (zi, ui, Oei) (yj Vj ôy) = 1 mM, j= 
. ,n}， 其 中 m,n 表示 两 样本 容量 。 取 分 位 数 g = 0.7，A 的 区 间 估 计 的 置信 水 平 1 一 a = 
0.95， 窗 宽 


3 i _ 3 -3 
Co 3, b 9” ; 
PK PRB 
Kj (u) = K2(u) = mf- a 


OT a ee 
得 区 间 的 平均 长 度 ，CP 表示 模拟 所 得 区 间 和 覆盖 A 的 真 值 的 平均 覆盖 率 。 

从 表 1 和 表 2 的 模拟 结果 可 看 到 如 下 事实 : 

1) 当 样 本 容量 适当 大 时 ， 在 分 数 填补 法 下 得 到 的 置信 区 间 平 均 履 盖 率 接近 置信 水 
平 0.95， 且 在 相同 的 响应 概率 和 相同 的 填补 次 数 下 ， 当 样本 容量 逐渐 增 大 时 ， 所 得 区 间 的 
平均 长 度 逐 渐 缩 短 ， 区 间 覆 盖 真 值 的 平均 覆盖 率 逐 渐 逼 近 0.95; 

2) 在 样本 容量 和 响应 概率 不 变 时 ， 随 着 有 的 增 大 ， 所 得 区 间 的 平均 长 度 呈 递减 趋势 ， 且 
区 间 平 均 柳 盖 率 与 置信 水 平 0.95 的 接近 程度 越 高 ， 特 别 地 当 k = 工时 ， 即 随机 填补 法 下 所 得 区 
间 的 平均 长 度 比 分 数 填补 (k > 2) 下 所 得 区 间 平 均 长 度 大 ， 模 拟 结果 较 差 ， 当 k > 7 时 ， 模 拟 结 
RMF k = 6 的 情形 ， 结 果 趋 于 稳定 。 
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表 1: 情形 1 下 的 模拟 表 2: 情形 2 下 的 模拟 
(mn) k | AL CP(%) (mn) k | AL PA) 
1 “ah 0.66999 93.0 1 1.54247 92.5 
2 0.57249 93.7 2 1.42450 93.0 
3 0.58325 94.0 3 1.32682 94.1 
(100,100) 4 0.56109 95.9 (100,100) 4 1.25730 94.6 
5 0.53732 95.4 5 1.15483 95.7 
6 0.48930 95.2 6 1.13761 95.4 
1 0.65225 93.5 1 1.47761 94.0 
2 0.61170 94,3 2 1.37892 93.2 
3 0.57614 94.7 3 1.39539 94.8 
(200,200) 0.55006 93.9 (200,200) 4 1.27276 94.7 
5 0.56010 94.6 5 1.22792 94.5 
6 0.47459 95.2 6 1.17689 95.2 
1 0.64623 93.6 1 1.43726 92.8 
2 0.60531 93.8 2 1.41044 93.6 
3 0.57102 94.8 3 1.34658 95.2 
(300,300) 4 0.54116 94.7 (300,300) 4 1.31480 94.3 
5 0.50134 95.4 5 1.15833 95.6 
6 lis 0.48017 95.1 6 1.09978 95.3 


注 ; 填补 次 数 k 取 为 正 整数 ， 目 前 还 没有 一 个 统一 的 方法 决定 k， 也 没有 最 优 的 k 的 选 
取 方 法 (一般 讲 ，k 越 大 ， 填 补 方差 越 小 ， 故 最 优 的 k 一 般 不 存在 )， 但 可 用 经 验方 法 大 致 确 
E k (IXH [10,11] 大 的 经 验 选取 原则 是 :对 大 = 1,2,… ,10， 通 过 模拟 来 比较 结果 的 好 
坏 ， 即 选 定 模 拟 结果 比较 稳定 ( 即 天 再 增加 时 ， 得 到 的 结果 改变 不 大 ) 时 的 k&， 已 有 的 模拟 结果 
表明 ，k 在 5-10 之 间 时 的 结果 比较 好 。 

致谢 : 衷心 感谢 审 稿 人 对 本 文 提出 的 宝 责 修 改 意见 。 
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Abstract: The comparison of differences of populations is an important research topic in medical stud- 
ies, economical and educational fields. This paper studies the construction of the quantile differences of 
response variables in two linear models with missing data. The fractional linear regression imputation 
method is used to impute the missing data of the response variables, and ‘complete’ data for two linear 
regression models are obtained. The empirical log-likelihood ratios of quantile differences of response 
variables are constructed based on the imputed data. Under some mild conditions, it is proved that the 
asymptotic distributions for the empirical log-likelihood ratios are scaled x?. The empirical likelihood 
confidence intervals for quantile differences of the response variables are then constructed based on this 
results. Simulations show that fractional imputation can improve the coverage accuracy of confidence 
intervals. 
Keywords: linear model; quantile; fractional linear regression imputation; empirical likelihood; confi- 
dence intervals 
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